Cohere,为企业提供大模型
2022 年底 OpenAI 发布产品 ChatGPT 之后,NLP支出增长加速,成为市场的拐点。当年年底一项调查中,77%的 NLP 相关企业表示,计划在未来 12-18 个月内增加支出,其中 38% 的企业计划将至少增加 11% 的支出。
然而,公司在采用 NLP 方面仍面临巨大的障碍。NLP 中使用的大型语言模型的训练成本可能超过 1000 万美元,实际使用成本甚至更高。NLP 模型本身不仅昂贵,而且聘请专业人士来管理也很困难。
Cohere 为企业提供 NLP 模型。它允许公司将 NLP 融入应用程序中,而无需公司内部开发自己的模型。Cohere 构建通用语言模型并通过 API 来访问。公司可以立即使用这些模型,也可以根据自己的特定需求对其进行微调。
一、创立故事
Aidan Gomez(首席执行官)、Nick Frosst 和 Ivan Zhu 于 2019 年创立了 Cohere。三人都在多伦多大学攻读本科。Gomez 随后在牛津大学获得了计算机科学博士学位。Gomez和 Frosst特后来成为多伦多谷歌大脑的人工智能研究人员。在谷歌工作期间,Gomez的朋友 Ivan Zhang 会定期到办公室与他一起研究深度学习,Ivan Zhang 从大学辍学后在初创公司For.ai 担任软件工程师。
2017 年 6 月,年仅20岁的 Gomez 与人合著了一篇名为《Attention Is All You Need》的论文,该论文开创了 Transformer 模型,这是一种彻底改变 NLP 任务的神经网络架构。那时,领导Google Brain的还是因深度学习获得图灵奖的「深度学习三巨头」之一Geoffrey Hinton。
Transformer 使用自注意力(self-attention)来衡量输入不同部分的重要性。与以前的语言模型(如循环神经网络)相比,它们具有更高的并行性,能够在更大的数据集上进行训练。它们是性能最佳的语言模型的基础,包括 Cohere 模型和 GPT-4 等 OpenAI 模型(GPT 代表“生成式预训练变压器”)。Gomes 这样描述公司的起源:
“Nick、Ivan 和我创立 Cohere...整个目标是将这项技术、大型语言模型 [LLMS] 引入行业;将其推向世界并促进采用。没有人真正知道大型语言模型是什么,这是一个研究项目,有趣的技术,但没有真正的商业应用。但我相信:我们的语言……这对世界来说将越来越有价值。”
最初,团队并不太清楚他们想要为商业用例构建什么样的产品。然而,公司成立后不久,OpenAI 发布了 GPT-3,这代表了 LLMs 的拐点。正如Gomes 所言:
“刚开始时,我们并不真正知道我们想要构建什么产品......我们只是专注于构建基础设施,以使用我们可以获得的任何计算在超级计算机上训练大型语言模型。很快在我们启动 Cohere 后,GPT-3 出现了,这是一个巨大的突破时刻,非常有效,并给了我们[一个指示],表明我们正在走上正确的道路。”
2023 年初,YouTube 前首席财务官 Martin Kon(总裁兼首席运营官)加入团队。
二、公司产品
Cohere 为各种阅读和写作任务训练大型语言模型 (LLMs),例如摘要、内容创建和情感分析。其语言模型针对三个主要用例进行了优化:检索文本(retrieving text)、生成文本(generating text)和分类文本(classifying text)。
Cohere 为企业提供 API 端点,以利用其 LLMs 和许多部署选项,使企业能够通过 AWS 等云合作伙伴或 Cohere 的托管云安全地存储数据。为了更高效地帮助其LLMs客户,Cohere 还提供定制模型培训服务。
Cohere 首席执行官 Aidan Gomez 对该产品进行了如下描述:
“我们尝试构建特定用途的解决方案。我们有总结端点(summarize endpoint),我们有分类。我们发现这更像是一个成熟产品。对于这项技术,人们最兴奋的是它的通用性“我们不是为他们提供问题的解决方案,而是为他们提供一个通用平台(Cohere 模型)。就像这个通用软件,可以在合理的范围内解决您遇到的任何问题。”
1、检索文本(Retrieving Text)
Cohere 产品中提供了三个主要 API 端点,这些端点专注于检索文本以进行搜索、聚类和推荐。
Embed(嵌入):该端点提供英语和 100 多种语言的准确嵌入,使用户能够发现趋势、比较语言并根据数据构建自己的文本分析应用程序。
Semantic Search(语义搜索):为用户提供语义搜索功能,可根据含义(而不仅仅是关键字)查找文本、文档和文章。它允许开发人员为任何语言构建更好的搜索系统。
Rerank(重新排名):重新排名提高了关键字或矢量搜索系统的搜索质量。它可以帮助系统更好地理解上下文以及问题和查询的含义,同时承诺对现有系统进行最小程度的修改。
2、生成文本(Generating Text)
Cohere 提供了三个专注于文本生成的 API 端点。该产品旨在生成上下文相关且类似人类的文本,包括:
Summarize:Summarize 提供大规模文本摘要功能,使用户能够构建从长文章或文档中提取和总结见解的应用程序。
Generate: 此 API 端点为各种上下文生成独特的内容,示例包括电子邮件、登陆页面和产品描述。通过提供主题和提示,生成 API 端点可以为用户创建相关的文本内容。
Command Model: 作为 Cohere 的旗舰文本生成模型,命令模型旨在遵循业务应用程序的用户命令。它可以执行诸如编写电子邮件或回答有关文档的问题等任务。Cohere 允许根据客户数据和语言对命令模型进行训练,从而为独特的业务需求提供定制解决方案。
3、文本分类(Classifying Text)
Cohere 的文本分类端点是 Cohere LLMs 的 API,专注于识别所提供文本的含义和见解。Classify 端点的示例用例包括产品评论的内容审核和情绪分析。Classify 端点的其他潜在应用包括聊天机器人体验和客户支持。与 Cohere 的其他 API 端点和 LLM 产品一样,客户可以向 Cohere 提供其数据,以接收针对其数据进行微调的定制模型。
三、市场格局
1、公司客户
正如 Cohere 首席执行官 Aidan Gomez 所描述的那样,Cohere 的目标客户是寻求独立人工智能平台的公司。
除了拥有大量资源的 FAANG 公司和 OpenAI 等竞争对手之外,大多数企业都缺乏训练自己的复杂语言模型的资金或人才。Cohere 的大多数潜在客户面临的第一个障碍是内部运行这些模型的成本。例如,预计 2022 年发布的 Google PaLM 模型在 AWS 上的一次训练需要花费 2500 万美元。
对于那些可能希望在内部建立这些模型的公司来说,第二个障碍是缺乏获得高素质人才的机会。无论是处于哪个发展阶段的人工智能公司,获取人工智能人才是一项重大挑战。即使在人工智能部署相对成熟的经验丰富的公司中,截至 2020 年,也有近 48% 的公司面临中度、重大或极端的人工智能技能差距。截至 2022 年,麦肯锡对 1,500 家公司进行调查,65% 的公司发现聘请软件工程师担任人工智能相关职位有些困难或极其困难,83% 的受访者表示,回顾过去三年,招聘此类职位要么更加困难,要么同样困难。
截至 2023 年 9 月,Cohere 的客户包括 Oracle、Notion、Jasper、Spotify、HyperWrite 和 Glean。
2、市场规模
2022 年 NLP 市场估值为 278 亿美元,预计 2023 年市场规模为 410 亿美元。预计到 2030 年,该市场将达到 4400 亿美元年复合年增长率预计为 40.4%。另一份报告预测,到 2032 年,生成式人工智能的规模将达到 1.3 万亿美元,复合年增长率高达 42%,其增长是由人工智能副驾驶(AI copilot)提高编程速度、专业人工智能助手和新基础设施等产品所推动。
OpenAI的产品ChatGPT发布,推动了生成式AI市场的快速增长。ChatGPT 于 2022 年底发布后,在两个月内就获得了 1 亿活跃用户,这使其成为历史上增长最快的消费应用程序,并成为生成式 AI 市场的拐点。2022 年底的一项调查发现,77% 使用 NLP 解决方案的公司计划增加未来投资。
3、行业竞品
(1)OpenAI
2015 年成立,是一家领先的人工智能研究实验室,开发了多个 GPT 迭代模型,与 Cohere 的产品类似的LLM。OpenAI 的 GPT-3 于 2020 年 6 月发布,已广泛应用于从内容生成到客户服务自动化的各种应用。但 OpenAI 迎来“AI 热潮”的分水岭是 2022 年 11 月发布的 ChatGPT,这是一款针对对话优化的LLM。截至 2023 年 2 月,ChatGPT 在推出仅两个月后就达到了 1 亿月活跃用户,使其成为历史上增长最快的消费者应用程序之一。OpenAI 的声誉、广泛的研究能力及其模型的广泛采用对 Cohere 构成了重大的竞争威胁。OpenAI 已经获得多轮融资,该公司估值在1000亿美元左右。
(2)Meta
Meta 的前身是 Facebook,是一家在人工智能研发领域投入巨资的科技集团。其人工智能研究部门 FAIR(基础人工智能研究)开发了各种人工智能模型和工具,其中一些与 Cohere 的产品直接竞争。2023 年 7 月,Meta 发布了 Llama 2,这是一个在 2 万亿 Tiken 上进行预训练的免费用于研究和商业用途的 LLM。在推理任务中,Llama 2 的发布与 OpenAI 的 GPT-3.5(类似于 ChatGPT)相当,作为开源 LLM 对 Cohere 构成了重大威胁。
(3)谷歌
2023 年 4 月,谷歌将 DeepMind(一家世界领先的人工智能研究实验室,以其在强化学习和神经网络方面的工作而闻名)与其现有的谷歌大脑团队合并。自 ChatGPT 快速采用以来,Google 在将 LLM 功能集成到其现有产品方面取得了重大进展。2023 年 3 月,谷歌发布了 Bard,这是一款人工智能聊天机器人,与 Cohere 的命令模型等对话式人工智能产品直接竞争。Google 作为领先的人工智能研究公司的地位及其丰富的资源和渠道使其成为 Cohere 的重要竞争对手,Google 在其 Workspace 产品等产品中不断增加 LLMs 的使用。
(4)Anthropic
2021年由OpenAI前高管成立,是一家人工智能研究公司,专注于构建可靠、可解释和可操纵的人工智能模型,旨在让大型语言模型变得更易理解、更可控。Anthropic 对可解释性和安全性的关注可能会吸引寻求人工智能模型透明度和定制化的客户,从而对 Cohere 构成竞争威胁。2023 年 5 月,Anthropic 筹集了 4.5 亿美元的 C 轮融资,泄露的融资方案目标估值为 41 亿美元。
(5)Stability AI
Stability AI是一家开发开源模型的人工智能公司。其 Stable Diffusion 文本到图像模型于 2022 年 8 月发布,取得了巨大成功,截至 2023 年 7 月,在 Github 上获得了超过 27,000 颗星,并激发了超过 3,500 个分叉(forks)。虽然没有达到 Stable Diffusion 的成功水平,但该公司发布了 Stable LM,于 2023 年 4 月开源 LLM。作为 LLM,Stable LM 直接与 Cohere 的产品竞争,其作为开源模型的地位给 Cohere 的产品带来了压力。Stability AI 筹集了高达 2500 万美元的资金,在 2022 年 10 月种子轮融资后估值为 10 亿美元。2023年年底,Stability AI 考虑被并购,管理层面临着越来越大的财务压力。据报道,潜在买家包括 Cohere和Jasper。
四、商业模式
Cohere 承担着构建每个模型的大量前期成本和持续的推理成本。它通过基于使用量的定价来收回成本,并提供三种不同的定价等级:
免费:访问所有 Cohere API 端点,并限速使用,用于学习和原型设计。
产品:增加对所有 Coheres API 端点的访问速率限制、增强客户支持以及根据提供的数据训练自定义模型的能力。Cohere 根据其所有 API 端点的Token数量(Token基本上是数字、字母或符号)进行收费,端点的价格各不相同,从每个Token 0.0000004 美元(嵌入)到 0.001 美元(重新排序)不等。
企业:专用模型实例、最高级别的支持和自定义部署选项。企业级的定价未公开。
五、重大进展
2021 年 11 月 Cohere 推出了 API,在 2021 年 9 月宣布的 A 轮融资和 2022 年 2 月宣布的 B 轮融资之间,使用量增长了 800%。
2021 年 11 月,公司宣布与 Google Cloud 建立合作伙伴关系,以访问构建和部署其产品所需的云计算基础设施。该合作伙伴关系包括谷歌的云张量处理单元(TPU),它是“针对大规模机器学习进行优化的超级计算机”。
2023 年 6 月,Cohere 宣布与 Oracle 建立合作伙伴关系,利用 Oracle 云基础设施 (OCI) 来训练、构建和部署其LLMs。Cohere 最大的进展出现在企业市场。
2023 年 7 月,Cohere 和麦肯锡于宣布开展战略合作,麦肯锡将为其客户提供 Cohere 的生成式 AI 服务。
六、公司估值
2021年9月,获得4000万美元A轮融资,Index Ventures领投
2022年2月,获得1.59亿美元B轮融资,投资方包括Geoffrey Hinton、李飞飞、Pieter Abbeel,还有知名基金Tiger Global Mangerment、Index Venture等
2023 年 5 月,获得 2.7 亿美元 C 轮融资,估值超过 21 亿美元,投资方为Inovia、Nvidia、Oracle、Salesforce Ventures、DTCP、Mirae Asset、Schroders Capital、SentinelOne、Thomvest Ventures以及之前的投资者Index Ventures。
2023 年 7 月,SAP 向 Cohere 投资了一笔金额未披露的资金,作为对生成型人工智能初创公司更广泛投资的一部分,该公司还投资了 Anthropic 和 Aleph Alpha
2023年8月,Tiger Global以6300万美元的价格出售了其持有的Cohere 2.1%的股份,这意味着Cohere的估值已增长至30亿美元。即使在出售后,Tiger Global 仍保留该公司 5% 的股份。
目前Cohere已经从投资者那里筹集了超过4.45亿美元,包括知名投资机构Tiger、Index Ventures、Radical Ventures和Section 32。以及AI领域的知名人士,如被称为“AI教父”的Geoffrey Hinton、斯坦福计算机科学家Fei-Fei Li、伯克利教授/机器视觉的深度学习技术Covariant AI 创始人的Pieter Abbeel、多伦多大学教授/加拿大自动驾驶技术公司创始人Raquel Urtasun。
七、投资机会
1、LLMs 用例不断增长
尽管人工智能在 2023 年已得到消费者的快速采用,但LLMs的商业化仍有相当大的增长空间。Cohere 首席执行官 Aidan Gomez 表示:
“我们还处于早期阶段......两年后的世界看起来会非常不同,这项技术将成为我们与每一种产品互动的特性。它只是变成了日常,也成为了一种期望。你期望与一个像人类一样聪明的自动化代理交谈。”
如果这样的世界成为现实,对 Cohere 产品的需求将会非常高。Cohere 已做好充分利用这一不断增长的需求的准备。
2、语言是人机交互的未来
Cohere 的最佳场景是其语言模型足够先进,实现人机交互无缝连接。谷歌云首席执行官 Thomas Kurian 表示:“语言是人们与系统交互方式进化的下一个重要阶段。”如果在特定或一般用例中使用生成式人工智能的 AI 代理变得与人类没有区别,那么它将继续推动 LLMs 的采用。
3、洞察非结构化数据
分析师估计,80-90% 的数据是非结构化的。然而,非结构化数据(例如文本、图像、音频文件等)缺乏一致的数据模型,使得分析变得困难。结构化数据通常以易于处理的表格格式存储,对于公司来说相对容易分析和搜索。只有 18% 的组织利用了非结构化数据,比结构化数据少 3 倍。
非结构化数据只会变得更加普遍,年增长率约为 60%,而结构化数据的年增长率为 12%。自然语言处理(NLP)对于释放大量非结构化数据的洞察力是必要的。金融、航运、法律和医疗保健等行业已经使用 NLP 从文本中提取结构。NLP 还可以提高可搜索性,包括语义搜索(按含义搜索)。
4、多模态语言模型的机会
Cohere 的创始人兼首席执行官 Gomez 将包含“语言视觉基础系统”的多模态语言模型描述为“非常有前途”。计算机视觉不仅可以改进 Cohere 的语言模型,还可以为 Cohere 提供额外的独立产品。从 NLP 扩展到计算机视觉将使 Cohere 的潜在市场规模扩大一倍,因为估计计算机视觉市场预计将从 2020 年的 95 亿美元增长到 2030 年的 410 亿美元。
八、主要风险
1、开源模型对LLM商品化的威胁
Stable LM 和 Llama 2 等开源大型语言模型的发布给 Cohere 的商业模式带来了重大风险。这些开源模型使高级语言处理功能的访问变得更加大众化,可能会削弱 Cohere 的竞争优势。如果更多的开发人员和组织采用这些免费的替代方案,Cohere 可能会在吸引和留住客户方面面临挑战。
虽然 Cohere 的模型可以提供独特的特性和功能,但考虑到免费、高质量的替代方案的可用性,其价值主张( value proposition)对于某些客户来说可能不够有吸引力。更多地采用开源LLMs,可能影响其盈利能力和可持续性。面对这些挑战,Cohere 需要不断创新并使其产品脱颖而出,以维持其市场地位。
2、大型语言模型的潜在的偏见
语言模型有时会表现出偏见并产生不恰当的语言,引发道德和法律问题。2021 年,联邦贸易委员会(FTC)禁止公司使用有偏见的算法做出影响消费者的决策。偏差的产生是因为语言模型反映了其训练数据的特征。像 Cohere 这样的大型语言模型通常是在包含偏见语言的海量互联网数据上进行训练的。尽管 Cohere 正在着力解决其模型的安全问题,但Gomes认为该公司永远无法完全解决这些问题。
九、总结
通过其 API,Cohere 为客户提供了用于生成文本、对文本进行分类或生成文本的语言模型的访问权限。NLP 的进步速度不断加快,像 Cohere 这样的公司必须在向客户提供的模型方面保持领先地位。障碍包括竞争对手之间的产品差异化以及应对现有语言模型中持续存在的偏见和弱点。Cohere 有能力帮助客户避免运行这些模型的高成本以及有效管理技术人才短缺的障碍。
经过大半年运营,我们AI创投社区已经超过了10000人,其中经过实名认证的会员超过200人,大都来自全球科技大厂、顶尖投资机构和高潜创业企业。
欢迎联系凯瑞(pkcapital2023),与一群志同道合的小伙伴一起探讨。
AI公司
+
OpenAI:人工智能突破的前沿丨员工名册丨董事会丨营销团队丨GPT Store丨科技狂人丨马斯克丨地产生意经丨微软丨投资帝国
Adobe丨Anthropic丨Amazon丨Canva 丨DoNotPay丨Figma丨Google丨Hugging Face丨Midjourney丨Neuralink丨Pika丨Replicate丨Replite丨Runway丨Scale AI丨Shein丨Stability AI丨Vannevar Labs丨Zapier
AI行业
+
AI写作工具丨AI编程工具丨AI客服工具丨AI法律工具丨AI医疗工具丨AI视频工具丨AI搜索工具丨AI合成数据丨AI企业服务丨AI Agent代理丨AI个人助手丨AI生产力工具丨LLMOps市场地图丨AI创始人丨全球高增长AI 50丨AI:即将到来的科技革命丨2023年企业生成式人工智能现状报告丨AI 正推动云计算的下一波增长丨旧金山湾区成为Gen AI早期赢家丨我们离AGI还有多远?丨巨头的AI战争丨欧洲AI创业地图丨AI+浏览器丨开源人工智能市场研究报告丨人工智能的未来丨科技巨头的未来丨北美科技人才中心地图
AI创投
+
创业:
1人团队,百万营收的AI套壳丨如何从零打造一家AI驱动的公司?丨如何独自创办你的初创公司?丨如何通过AI写作实现年入千万?丨值得关注的人工智能初创公司丨如何在6个月内,通过AI月入6万美元?丨你的性格决定创业成败丨从互联网到生成式AI狂潮揭示了哪些不变的真理?丨 如何寻找和评估创业方向?丨CEO如何确定自己的薪水?丨如何分配股权和头衔?丨如何组建和召开创业公司董事会?丨GTM指南丨如何选择VC?丨写商业计划书(BP)丨AI+法律:创业机会地图丨公司估值的艺术丨海,如何找到创业合伙人?
投资:
为什么说Gen AI拯救了风投界?丨全球顶尖VC投了哪些AI初创公司?丨中美AI创投赛道有何异同?丨如何评估AIGC初创公司的竞争优势?丨知名海外投资人谈AI新趋势丨做通才还是专才风险投资人?丨红杉资本如何做投资?丨如何及早识别独角兽创始人?丨风险投资公司如何避免7大陷阱?丨合伙人是怎么炼成的?丨Thrive Capital丨英伟达投资策略CEO丨Souring的艺术